خزش متمرکز وب با هدف کشف اسناد وب معنایی

thesis
abstract

با توجه به گسترش روزافزون وب معنایی و افزایش حجم داده های معنایی بر روی وب، لازم است تا این داده ها با کمک ابزار هایی از سطح وب جمع آوری شوند تا بتوان از آنها در کاربرد های مختلف استفاده کرد. یکی از ابزار های مهم در این زمینه، خزنده وب است. خزنده وب، برنامه ای است که اسناد را به طور خودکار و با دنبال کردن پیوند های داخل آنها، از سطح وب جمع آوری می کند. در حوزه وب معنایی، هدف خزنده جمع آوری اسناد وب معنایی است. عدم پیوند کافی بین این اسناد و احاطه شدن آنها توسط اسناد html، موجب شده است تا بسیاری از خزنده های وب معنایی، علاوه بر اسناد وب معنایی، اسناد html را نیز واکشی کنند. اما با توجه به حجم بالای اسناد html و غیر معنایی بودن بسیاری از پیوند های داخل آنها، واکشی این اسناد و پیمودن همه مسیر های ایجاد شده توسط آنها، باعث اتلاف منابع و پایین آمدن سرعت دستیابی به اسناد وب معنایی می شود. در این پایان نامه، یک خزنده وب معنایی ارائه شده است که از خزش متمرکز برای حل مشکلات بیان شده استفاده می کند. در خزش متمرکز، هدف خزنده جمع آوری اسناد در مورد یک موضوع خاص است و پیوند ها بر مبنای میزان ارتباطشان با موضوع مورد نظر اولویت بندی می شوند. اما در خزنده پیشنهادی، به جای خزش موضوعی، پیوند های استخراج شده از اسناد html تحلیل می شوند و بر مبنای توانایی شان در دستیابی به اسناد وب معنایی اولویت بندی می شوند. برای این منظور، خزنده از دو تابع ارتباط استفاده می کند. نتایج ارزیابی ها نشان می دهد که بکارگیری فرآیند خزش متمرکز و توابع ارتباط پیشنهادی، موجب دستیابی سریعتر به اسناد وب معنایی و کاهش حجم واکشی اسناد غیر معنایی می شود.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

کشف سیر تحوّل در حوزۀ «وب معنایی» با رویکرد نوین RPYS

هدف: با استفاده از تحلیل مآخذ استنادی با تأکید بر سال انتشار این مآخذ می­توان اهمیت آثار پیشین را برشمرد و خاستگاه­های تاریخی یک حوزۀ پژوهشی را آشکار نمود. در این پژوهش، بر آنیم تا با روش جدیدی به نام طیف سنجی سال انتشار مآخذ، مهم­ترین آثار تاریخی در حوزه وب معنایی را مشخص نماییم. روش‌شناسی: داده­های اولیه این پژوهش، که با استفاده از روش علم­سنجی و برای بررسی ریشه­های تاریخی حوزه وب­معنایی انجا...

full text

کشف سیر تحوّل در حوزۀ «وب معنایی» با رویکرد نوین RPYS

هدف: با استفاده از تحلیل مآخذ استنادی با تأکید بر سال انتشار این مآخذ می­توان اهمیت آثار پیشین را برشمرد و خاستگاه­های تاریخی یک حوزۀ پژوهشی را آشکار نمود. در این پژوهش، بر آنیم تا با روش جدیدی به نام طیف سنجی سال انتشار مآخذ، مهم­ترین آثار تاریخی در حوزه وب معنایی را مشخص نماییم. روش‌شناسی: داده­های اولیه این پژوهش، که با استفاده از روش علم­سنجی و برای بررسی ریشه­های تاریخی حوزه وب­معنایی انجا...

full text

نقش وب معنایی در بازیابی اطلاعات

هدف: معرفی نسل آتی وب که وب معنایی است و از طریق تجهیز اطلاعات با اجزاء معناشناختی مشخص همکاری میان انسان و رایانه را فراهم می نماید. به بیانی دیگر وب معنایی نوعی روش برای کد گذاری و بازیابی اطلاعات است به گونه ای که ماشین ها (رایانه ها) قادر به پردازش و فهم اطلاعات باشند. روش شناسی: در این مقاله با استفاده از روش کتابخانه‌ای و بررسی متون اسناد، در ابتدا به گردآوری اطلاعاتی در مورد شبکه جهانی...

full text

"فضای مفهومی" رویکردی جهت توسعه وب معنایی

هدف از انجام پژوهش حاضر بررسی معنابخشی به بافت از طریق کاربرد نظریه‌هایی همچون نظریه فضاهای مفهومی است. دلیل استفاده از این نظریه این است که این نظریه به بررسی بازنمایی دانش و سازه معنایی می‌پردازد و به چگونگی تشکیل معنا در فضای مفهومی واژگان و کاربرد آنها در بافت توجه دارد. روش: پژوهش کاربردی و روش انجام آن تحلیلی است. یافته‌ها: نتایج پژوهش نشان داد که وب معنایی به عنوان بستری برای بازنمون دان...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023